%
%~~
%~~  Conclusões
%~~
%
\chapter{Conclusões}
\label{08:chp:conclusoes}
%
O sistema estendido de diagnóstico proposto tem como principal objetivo realizar o diagnóstico como um sistema especialista e indicar relações com eventos que ocorrem no ambiente da ocorrência médica. A construção de um sistema desta natureza exigiu diversas esferas de estudo por parte do grupo. Apesar disso, os campos abordados são muito vastos e existem lacunas de pesquisas de longo prazo para todos os assuntos abordados, sem excessão.

O modelo de cobertura de conjuntos utilizado no sistema demonstrou-se atrativo pela sua simplicidade e, ao mesmo tempo, eficiente em manipular múltiplas doenças, garantindo um baixo custo computacional. Além disso, é aceitável e plenamente funcional para a utilização em problemas de diagnóstico, sendo, portanto, uma alternativa aos sistemas especialistas com mecanismos de inferência baseados em regras de produção. O modelo de cobertura de conjunto foi facilmente aplicado dentro da arquitetura e ofereceu ampla flexibilidade para a extensão do sistema, conforme era desejável para com o mecanismo de mineração de dados.

O mecanismo de mineração foi testado a partir dos dados de entrada de temperatura no estado de São Paulo e a partir dos dados de ocorrências de doenças do SUS brasileiro. O objetivo sobre estes dados é afirmar que a temperatura possui alguma relação com a ocorrência de certas doenças respiratórias. O resultado previsto para o trabalho sobre dados eram regras que definissem faixas específicas de classes de ocorrências com taxa de acertos entre 30\% e 60\%.

Os testes realizados nas doenças em geral porém não puderam ser realizados da forma como se esperava, isto pois as regras geradas possuiram uma amplitudade alta, como mostra a Figura~\ref{img:amplitudedados}. Os valores das faixas de ocorrências vão desde 1 até 2750, o que indica uma falta de regularidade nos dados. As doenças seguem a mesma tendência em particular.

\begin{figure}[htb]
	\center
	\includegraphics[scale=0.6]{images/amplitudedados.png}
	\caption{Faixas de ocorrências com as temperaturas.}
	\label{img:amplitudedados}
\end{figure}

Com esta alta variabilidade de ocorrências, pode ser que um fator muito mais forte do que a temperatura esteja influenciando a variação observada. Se for observado na Figura~\ref{img:graficocomparativo} em particular o número de ocorrências das doenças, elas possuem alguns valores próximo de zero em pontos mais antigos e explodem quando chegam em determinados meses de 2003.

\begin{figure}[htb]
	\center
	\includegraphics[scale=0.4]{images/graficoocorrencias.png}
	\caption{Número de ocorrências por doenças.}
	\label{img:graficocomparativo}
\end{figure}

O fato de a curva de ocorrências não possuir forma intuitiva não representa um problema, pois, se a curva se apresenta recorrentemente, é possível normalizar o seus valores aproximadamente e assim separar o estudo apenas o efeito da variável temperatura sobre os dados. Mas não é possível traçar hipóteses de como as curvas se comportam com as ferramentas disponíveis.

A principal forma de resolver este problema seria normalizar a entrada dos dados para remover incoerências e manter uma quantidade de produtores de dados constante e controlados. É provável que os dados estejam apresentados assim pois a implementação do sistema no SUS em São Paulo deve ter ocorrido em degraus, com poucos hospitais cadastrando ativamente no sistema em 2003, muitos hospitais utilizando ativamente até meados de 2004, e logo mais substituído por outro sistema cujos dados não se encontram disponibilizados no mesmo local.

Outro ponto importante é o objetivo do sistema de cuja base de dados está sendo analisada. O intuito dele era contabilizar o dinheiro gasto com o sistema público de saúde tanto com seviços gratuitos quanto com alguns serviços restritos que são pagos, e paralelamento traçar o perfil de morbidade da população. Isto fica bem claro quando a base é analisada e se verifica que certas doenças não devem ser apontadas pelo campo do CID e sim por um campo especial que aceita \textquotedblleft sim \textquotedblright ou \textquotedblleft não\textquotedblright como entrada.

A escolha dos dados foi realizada com base na abrangência de datas em que eles estão reunidos, existem ocorrências entre 1999 e 2004, e também pela quantidade, cerca de 20 mil ocorrências. Tais requisitos foram satisfeitos devido a algumas doenças que ocorreram em datas esparsas em quantidade razoável e portanto passou pelo crivo de seleção. Apesar disso, as regras terem apontado para estes fatos demonstra o poder do modelo proposto.

